DUAL: Marco eficiente y consciente de incertidumbre para RL offline-online Descubre el marco DUAL que optimiza el aprendizaje por refuerzo offline a online, mejorando el rendimiento mediante cuantificación de incertidumbre. 2026-06-01 · 2 min